estat_sia_sih_agrot_corr


Indicadores

Medidas descritivas
agr Mínimo 1o Quartil Mediana Média 3o Quartil Máximo Desvio Padrão
agrmenld14a20 0 80 109 169.85 190.5 3937 251.06
agrmenlq14a20 0 214 312 462.51 566.0 5344 507.81
agrmenvmp14a20 0 1 10 46.84 46.0 2382 142.14
agrmaiguvmp14a20 0 0 0 10.26 6.5 225 24.99
Medidas descritivas
type Mínimo 1o Quartil Mediana Média 3o Quartil Máximo Desvio Padrão
agrindic1 -0.50 0.18 0.24 0.21 0.28 0.50 0.15
agrindic2 0.00 0.53 0.58 0.62 0.68 1.51 0.20
agrindic2_scaled -3.14 -0.44 -0.19 0.00 0.32 4.55 1.00
indicador -483.84 -253.99 -149.65 0.00 108.55 4844.87 512.97
indicador_scaled -0.94 -0.50 -0.29 0.00 0.21 9.44 1.00

Pesos (os indicadores propostos por Humberto possuem pesos dinâmicos, variando dependendo do número/quantidade de registros. Bem interessante):

agrmenld14a20 agrmenlq14a20 agrmenvmp14a20 agrmaiguvmp14a20
Primeiro autovetor (pesos) 0.16021136889 0.987077983839 0.002477639441 -0.001797888356
Indicador 1 -0.5/qt_registros -0.7/qt_registros 1.2/qt_registros 1.3/qt_registros
Indicador 2 0.07/qt_registros 0.71/qt_registros 1.43/qt_registros 2.14/qt_registros

Variância explicada por cada componente principal:

[1] 0.770 0.173 0.056 0.001

Com os quatro componentes principais explicamos 100% da variabilidade presente/gerada pelas quatro medidas. Apenas com o primeiro componente principal conseguimos explicar 77% dessa variabilidade.


Associações


Anomalia e risco para neoplasia


Na escala da contagem somos muito mais suscetíveis à outliers. Quando olhamos para a escala das prevalências, além de diminuir drasticamente o impacto desses outliers, linearizamos a relação entre as variáveis.

Internamentos hospitalares (SIH), Período: 2008 : 2018


Queremos testar a associação entre as prevalências de neoplasias e anomalias, mas levando em consideração o efeito/dependência espacial (se existir). Tal tarefa é performada via um modelo linear espacial, também chamado de regressão (linear) espacial. Com um modelo desses somos capazes de quantificar a associação da prevalência de anomalias com a de neoplasias (em outras palavras, explicar a prevalência de neoplasias em termos da prevalência de anomalias), ao mesmo tempo que acomodamos a dependência/efeito espacial.

Além de não sabermos se esse efeito espacial realmente existe, temos ainda que “adivinhar” como a correlação espacial se dá. Para isso, usamos diferentes modelos i.e., diferentes tipos de correlação no espaço (figura abaixo). O primeiro modelo, um modelo Gaussiano/Normal i.i.d. (independente e identicamente distribuído) é o modelo mais simples, podendo ser chamado de baseline. Tal modelo basicamente não tem efeito espacial (é uma regressão/modelo linear simples), então podemos comparar os demais modelos (com efeito espacial) em relação a ele, o que vai nos dizer se o efeito espacial é realmente presente/significativo, e qual modelo melhor capta tal efeito/correlação.

No mapa do topo-esquerdo temos os dados i.e., as prevalências de neoplasia. Nos demais mapas tem as prevalências ajustadas por cada modelo (com base nas prevalências de anomalias e do efeito espacial). Visualmente, o modelo BYM parece ser o melhor. Para não ficarmos apenas no visual, existem medidas de comparação de modelos. O DIC, o WAIC e o CPO são do tipo menor-melhor. O MLIK é do tipo maior-melhor. De um modo geral, o modelo BYM realmente se mostra o mais adequado. Além disso, vemos como os modelos espaciais se saem melhor do que o não-espacial, mostrando que realmente temos aqui um efeito espacial.

Model DIC WAIC CPO MLIK
Modelo Gaussiano IID 2622.633 2623.167 1282.184 -1343.003
Modelo ICAR 2438.712 2447.768 1196.682 -1578.029
Modelo CAR Próprio 2433.135 2440.766 1197.676 -1291.202
Modelo BYM 2337.349 2335.337 1197.294 -1217.672
Modelo BYM2 2449.384 2458.812 1195.687 -1075.695

Abaixo temos as conclusões em termos da prevalência de anomalias. Ela é significativa, com uma estimativa de 0.889 (erro padrão de 0.059, bem baixo). Seu intervalo de confiança de 95% vai de 0.773 até 1.005. Como esse intervalo não contém o valor 0 (inclusive, está bem longe) temos confiança pra dizer que tal efeito é significativo. Quando olhamos pra distribuição do coeficiente vemos quão improvável é o valor 0. Ao lado da densidade temos o mapa do efeito espacial obtido com o modelo BYM. Vemos ali quais regiões tem um efeito espacial mais forte, mais fraco, e neutro.

mean sd 0.025quant 0.5quant 0.975quant mode kld
(Intercept) 15.914 1.129 13.697 15.914 18.130 15.913 0
ah08a18_1mil 0.889 0.059 0.773 0.890 1.005 0.890 0

Internamentos hospitalares (SIH), Período 2014 : 2018


Aqui vemos a presença de um forte efeito espacial, principalmente por duas razões: 1) o mapa do modelo sem efeito espacial é completamente diferente do mapa das contagens de prevalência observadas; 2) todos os mapas obtidos com modelos espaciais são parecidos (e similares ao mapa original/dos dados crus). Com base nos critérios abaixo o modelo BYM2 é extremamente superior aos demais, com tamanha diferença sendo estranha, já que seu mapa não difere tanto assim dos demais. Por agora, vamos ficar com o modelo BYM (vamos ser parcimôniosos).

Model DIC WAIC CPO MLIK
Modelo Gaussiano IID -1897.061 -2062.416 -656.6531 -709.388
Modelo ICAR 849.449 872.817 485.9122 -838.559
Modelo CAR Próprio 856.594 861.127 486.1771 -553.053
Modelo BYM 288.835 335.930 484.0998 -473.596
Modelo BYM2 -2250.394 -2360.395 -822.8039 -317.601

A prevalência de anomalias apresenta um efeito/associação positivo com a prevalência de neoplasias (efeito médio de 0.127). O valor 0 não está incluso no intervalo de confiança/credibilidade de 95% (0.055:0198). No mapa do efeito espacial estimado pelo modelo BYM, vemos poucas regiões com efeitos extremos/muitos fortes.

mean sd 0.025quant 0.5quant 0.975quant mode kld
(Intercept) 3.288 0.131 3.030 3.288 3.546 3.288 0
ah14a18_10mil 0.127 0.036 0.055 0.127 0.198 0.127 0

Atendimentos ambulatoriais (SIA), Período 2008 : 2018


Aqui temos um forte efeito espacial. Sem efeito espacial (apenas com as prevalências de anomalias) não somos capazes de emular o padrão de neoplasias. Visualmente todos os modelos são capazes de capturar o padrão espacial, o que dá a entender que temos um forte padrão espacial. Para manter um padrão vamos ficar com o modelo BYM.

Model DIC WAIC CPO MLIK
Modelo Gaussiano IID 2687.846 2688.355 1309.9177 -1364.305
Modelo ICAR 1836.146 1962.866 1141.5442 -1516.831
Modelo CAR Próprio 1607.792 1480.411 1149.9651 -1230.212
Modelo BYM -2273.847 -2412.516 -849.1659 -1140.499
Modelo BYM2 1879.292 1785.821 1140.1906 -1019.765

Fortíssimo efeito espacial e nenhum efeito da prevalência de anomalia na prevalência de neoplasia. Com outras palavras: num modelo espacial, o efeito espacial é capaz de explicar toda a variabilidade gerada pelas neoplasias não deixando nada para as anomalias.

mean sd 0.025quant 0.5quant 0.975quant mode kld
(Intercept) 18.745 0.255 18.244 18.745 19.245 18.745 0
aa08a18_1milhao 0.000 0.008 -0.016 0.000 0.017 0.000 0

Atendimentos ambulatorias (SIA), Período 2014 : 2018


Situação similar. Sem efeito espacial, apenas com as prevalências de anomalias, não somos capazes de descrever as prevalências de neoplasias. Aqui o modelo BYM tambem falhou, curiosamente. O melhor resultado é obtido com o modelo CAR próprio.

Model DIC WAIC CPO MLIK
Modelo Gaussiano IID 2869.734 2872.369 1379.632 -1455.582
Modelo ICAR 2276.875 2344.776 1263.713 -1641.296
Modelo CAR Próprio 1174.132 1036.243 928.671 -1335.786
Modelo BYM 2860.361 2830.534 1378.728 -1384.591
Modelo BYM2 2547.631 2574.152 1254.639 -1146.981

Forte efeito espacial e falta/inexistente efeito da prevalência de anomalias.

mean sd 0.025quant 0.5quant 0.975quant mode kld
(Intercept) 22.727 2.218 18.453 22.728 26.993 22.730 0.006
aa14a18_100mil -0.004 0.010 -0.023 -0.004 0.016 -0.004 0.000

Anomalia e resíduos de agrotóxicos na água potável


Neoplasia e resíduos de agrotóxicos na água potável


Correlações


Anomalia juntamente com resíduos de agrotóxicos na água potável e risco de neoplasia